2 上海星辉蔬菜有限公司, 上海, 201419
作者 通讯作者
《分子植物育种》网络版, 2020 年, 第 18 卷, 第 4 篇
收稿日期: 2020年04月26日 接受日期: 2020年04月26日 发表日期: 2020年04月26日
邰翔, 朱晓炜, 陈锦秀, 顾大国, 薄天岳, 2020, 利用QTL-seq挖掘与结球甘蓝叶柄长度相关的基因, 分子植物育种(online), 18(4): 1(10.5376/mpb.cn.2020.18.0004)(Tai X., Zhu X.W., Chen J.X., Gu D.G., and Bo T.Y., 2020, Using QTL-seq to mine genes related to petiole length of cabbage, Molecular Plant Breeding, 18(4): 1(10.5376/mpb.cn.2020.18.0004))
结球甘蓝外叶叶柄长度决定其单株占地面积,挖掘与结球甘蓝外叶叶柄长度相关的基因对于提高结球甘蓝的定植密度和单位面积产量意义重大。本试验利用结球甘蓝长叶柄高代自交系294(母本)、短叶柄高代自交系301 (父本)及其F2群体为材料,从F2中选出了极端性状植株(长叶柄, 短叶柄各30株)构建了DNA混池,利用QTL-seq与SNP/InDel-index相结合的分析方法得到与甘蓝外叶叶柄长度相关的候选基因。本研究从甘蓝全基因组中挖掘出6个控制甘蓝叶柄长度的候选基因,这些基因分别富集在SKU5蛋白编码、XTH蛋白编码及植物细胞壁合成的3条通路上。该研究为结球甘蓝叶柄长度相关基因的克隆及其功能分析提供了参考依据。
Using QTL-seq to mine genes related to petiole length of cabbage
Tai Xiang 1 Zhu Xiaowei 1 Chen Jinxiu 1 Gu Daguo 2 Bo Tianyue 1*
1 Horticultural Research Institute, Shanghai Academy of Agricultural Sciences, Shanghai, 201106; 2 Shanghai Xinghui Vegetables Company Limited, Shanghai, 201419
* Correspinding author, tybo@saas.sh.cn
Abstract The length of the petiole determines the area of a single plant. It is great significance to mining genes related to the length of the petiole of cabbage. In this experiment, short-petiole of high-bred line 301 (male parent)、long-petiole of high-bred line 294 (female parent) and its F2 were used as materials. Extreme trait materials were selected from F2 (30 long-petiole and 30 short-petiole materials) were used to construct pools of DNA. The candidate genes related to the petiole length of cabbage were mining using combination of QTL-seq and SNP / InDel-index. In this study, six candidate genes controlling the petiole length were identified from genome of cabbage. Seven candidate genes were enriched in the three pathways of SKU5 protein coding, (XTH) coding and plant cell wall synthesis. This study provides a reference for cloning of genes related to petiole length in cabbage.
Keywords Cabbage, Length of the petiole, QTL-seq
结球甘蓝(Brassica oleracea L. var.capitata) (十字花科芸薹属)是世界范围内普遍种植的蔬菜作物(方智远, 2008)。近年来中国结球甘蓝的种植面积逐年增加,其总产量和种植面积在所有蔬菜中位居第三(戴忠良等, 2007)。随着农业用地面积的不断减少,如何提高单位面积产量成为结球甘蓝产业发展的突出问题。通过多年的努力,中国已经通过利用杂种优势技术选育出甘蓝高产品种。但是由于甘蓝形态学特点为外叶偏平铺式生长,决定了甘蓝定植类型为低密度定植,大大降低了单位面积土地利用率,研究适合密植的甘蓝品种意义重大。
密植不仅可以提高作物光能利用率,而且可以提高作物单位面积土地利用率。而适合密植的关键因素就是选育出短叶柄作物品种。中国的大豆育种工作者已经在此方面取得了较大的研究成果(赵团结等, 1999)。由于甘蓝遗传多样性丰富,不同材料间的形态差异大,这就为选育出短叶柄甘蓝品种提供了可能。国内外有关甘蓝叶柄长度的研究报道并不多。缪体云利用DH群体及分子标记技术鉴定出了控制结球甘蓝叶柄长度的QTL位点,贡献率为8.7% (缪体云, 2007)。在模式作物的研究中,Hirokazu Tsukaya等学者通过构建双突变体对影响拟南芥叶柄长度的基因进行了检测,结果表明PHYB和ACL2基因通过控制细胞长度来控制叶柄长度,而GA和ROT3基因通过控制叶柄细胞增殖对叶柄长度进行调控(Hirokazu et al., 2002)。Hisamatsu等(2005)人通过设置不同的光照时间及强度得到结果:PHYB基因调控GA的产生,继而影响拟南芥叶柄的生长。Graaff及其团队在筛选叶片发育突变体的过程中分离出T-DNA突变体,得到了控制拟南芥叶柄长度的基因,该基因编码具有与AP2/EREBP成员的DNA结合域转录因子家族(Graaff et al., 2000),上述3项研究中的大部分结论都聚焦在赤霉素调控通路方面。
BSA (Bulked Segregant Analysis),即集群分离分析法,通过选择目标性状差异较大的材料构建分离群体(RIL、DH、F2),并得到极端表型混池(pool),通过对混池的测序、关联分析,对目标性状进行初定位继而对区间内的基因进行功能注释。高通量测序技术是对已知序列物种的不同个体进行基因测序,并在全基因组水平进行序列比对,寻找个体间的SNP、InDel差异,最后完成基因注释。
BSA-seq技术将二者有效的结合,通过构建差异混池进行SNP、InDel比对,具有准确、高效的特点。该方法适合具有主效QTL的定位,现已广泛应用于植物基因挖掘的研究中(Takagi et al., 2013; Lu et al., 2014; Pang et al., 2015)。
本研究利用BSA-seq对长柄、短柄的典型单株及混池进行全基因组重测序,最后利用SNP/InDel-index关联分析方法对控制结球甘蓝叶柄长度的基因进行挖掘。
1结果与分析
1.1结球甘蓝叶柄长度表型数据分析
在结球甘蓝(图1)的F2分离群体中,458份材料的叶柄/叶片比值介于0.17~0.68间。Q-Q图上的散点均靠近检测线,该分布曲线Skewness=-0.613、Kurtosis=0.623,均小于1,说明该组数据符合正态分布规律(图2),可以进行BSA-seq分析。
图 1 研究群体亲本及表型性状 注: A: 研究群体亲本; B: 目标性状表型 Figure 1 Parents and phenotypic trait of study population Note: A: Parents of study population; B: phenotypic trait |
图2 研究群体统计数据正态分布及Q-Q 注: A: 研究群体正态分布; B: 研究群体Q-Q Figure 2 Normal distribution and Q-Q plot of the statistical data of the study population Note: A: Normal distribution of the study population; B: Q-Q plot of the statistical data of the study population |
1.2原始数据质量分析
2个亲本材料和2个混合池的数据经过滤后的有效reads在47 233 389~56 254 445 bp之间,Q30≥92.15,GC含量在37.12%~37.73%之间,定位到基因组的reads比例在92.41%~94.01%之间,双端定位到基因组的reads比例在77.39%~79.79%之间(表1)。上述数据说明,测序数据质量较好,可用于下一步检测。
表1 测序数据质量统计表 Table 1 Quality statistics of sequencing data |
1.3质控后的数据与参考基因组比对分析
样品与参考基因组平均比对效率为93.05%,平均覆盖深度为20.50×,基因组覆盖度分别为94.25% (至少覆盖1×),89.31% (至少覆盖5×),83.69% (至少覆盖10×) (表2)。
表2 测序数据与参考基因组比对情况 Table 2 Alignment statistics of sequencing data to the reference genome |
1.4 SNP-index和INDEL-index的关联分析
本实验分别对样本的SNP-index和InDel-index进行了关联分析统计,结果发现利用拟合后ΔSNP-index的99百分位数,共得到4个区域,总长度为4.43 Mb,共包含669个基因,其中非同义突变的基因共380个。利用拟合后ΔInDel-index的99百分位数,共得到5个区域,总长度为10.11 Mb,共包含1 490个基因,其中移码突变InDel位点的基因共251个。且两个统计结果都把预测基因Mapping到第3号染色体的18 370 000 bp~23 500 000 bp之间。所以,我们把3号染色体的18 370 000 bp~23 500 000 bp这一区段确定为候选区间。通过将ΔSNP-index与ΔIn Del-index的关联分析,确定在该区段存在7个重叠区间,共得到663个候选基因(图3、表3)。在上述7个重叠区间内共包含618个候选基因。应用BLAST软件对候选区间内的编码基因进行多个数据库(NR、Swiss-Prot、GO、KEGG、COG)的深度注释。通过详细的分析,在候选区域内共注释到614个基因,其中在亲本间存在非同义突变基因共注释到357个,移码突变基因共注释到108个(表4)。
图3 SNP-index和InDel-index分析 注: A: 4个极端池的SNP韦恩图; B: SNP-index预测目标基因; C: 4个极端池的InDel韦恩图; D: InDel-index预测目标基因 Figure 3 SNP statistics and BSA analysis Note: A: Venn diagram of SNP in the four pools; B: SNP-index algorithm to map target gene; C: Venn diagram of InDel in the four pools; D: InDel-index algorithm to target gene |
表3 关联区域信息统计表 Table 3 Related area information statistics |
表4 候选区域内基因功能注释结果统计 注: 第一列单词均为不同功能注释数据库名称 Table 4 Statistics of annotation information in candidate regions Note: The frist column of words are the names of different function annotation database |
1.5叶柄长度候选基因分析
通过相关文献检索及富集KS参考值,我们从候选区间中筛选出6个与甘蓝叶柄长度呈显著相关的候选基因(表5)。通过注释分析,6个候选基因可以分成3类,第一类包括LOC103858631、LOC103859103,参与编码SKU5蛋白,该蛋白参与植物细胞及组织的极性生长。第二类包括LOC103859141、LOC103858712,参与编码木葡聚糖内转葡糖基酶/水解酶蛋白9,该基因在植物叶片形成及茎节生长中起着重要作用。第3类参与细胞壁形成与降解。其中,LOC103858641为果胶酯酶/果胶酯酶抑制因子,LOC103860115所编码的蛋白质通过影响糖类的合成与运输,从而影响半纤维素的含量。
表5 候选基因信息 Table 5 Candidate gene information |
2讨论
近年来,随着高通量测序技术的不断发展,越来越多的的学者将BSA与全基因组、转录组结合去寻找感兴趣的基因。该方法不仅准确且高效。其中QTL-seq主要针对表型性状表现为数量遗传的基因,通过构建分离群体,得到目标性状分离较大的样本去Mapping目标基因。由于甘蓝遗传变异丰富,容易构建起目标性状分离明显的研究群体。通过QTL-seq研究目标基因已成为甘蓝类植物遗传学上常用的Mapping基因的方法。杨茹涵等(2019)利用QTL-seq方法,以花色性状分离明显的F2群体为研究材料,得到了控制芥蓝花色的主效QTL位点。任杰(2019)利用QTL-seq方法,将控制羽衣甘蓝叶裂基因定位在C09染色体上LYIn39和LYIn40两个标记之间。张小丽(2017)利用QTL-seq方法,在甘蓝的第9号染色体上38.79 MB到39.35 MB处发现了一个控制甘蓝抗根肿病的QTL位点BoCR9.1。本研究利用QTL-seq的方法,利用目标性状分离明显的F2及亲本材料为试验材料,通过构建性状分离混合池并结合基因组重测序技术得到了6个控制叶柄长度的候选基因。
通过对6个控制叶柄长度的候选基因分析,发现这些基因富集在SKU5蛋白编码、XTH蛋白编码及植物细胞壁合成的3条通路上。其中,SKU5蛋白归为SKS蛋白家族,该类蛋白可能作用于细胞生长,现已在拟南芥、油菜、烟草等植物中被报道。SKU最早是从拟南芥中得到(Sedbrook et al., 2002),是一个定位在细胞质膜及细胞壁上的GPI蛋白,可能参与到细胞及组织极性生长(张志仙等, 2011)。木葡聚糖内转葡糖基酶/水解酶(XTH)是参与细胞壁松弛和重构的重要因素(Fry and Stephen., 1995)。该蛋白质参与了多种植物茎节生长,Nakamura等(2003)、Matsui等(2005)分别在赤豆、拟南芥的实验中发现XTH在控制植物茎生长中起着重要的作用。植物细胞壁是限制植物细胞生长的重要因素(李桂俊, 2015),细胞壁的松弛和重构机制决定着细胞的生长。果胶、半纤维素是构成细胞壁的主要成分。本实验中发现的2个与细胞壁相关的候选基因分别参与了果胶、半纤维素的合成和代谢。果胶酯酶/果胶酯酶抑制因子调控植物体内果胶的形成与分解。At4g38940 (王书, 2016)所编码的蛋白质通过影响糖类的合成与运输,从而影响半纤维素的含量。从细胞伸长生长的机制可以看出,当植物细胞通过被动或主动吸收作用促使其生长后,细胞壁的重构需要大量的半纤维素、果胶的参与,本实验中发掘出与细胞壁相关的2个基因可能参与到细胞壁的重构过程中。
通过检索前人的研究还发现赤霉素可以调控植物叶柄的生长,但是在本研究中未发现与赤霉素相关的候选基因,这暗示着可能还有其他通路直接影响着植物叶柄的生长。
3材料与方法
3.1材料
甘蓝高代自交系材料“294”(父本)、甘蓝高代自交系材料 “301”(母本)与二者的F2共同构成研究群体。父本材料(“294”):长柄、圆球、中熟、抗病。母本材料(“301”):短柄、圆球、中熟、抗病(图1)。2015年4月用“301”材料作母本,“294”材料作父本配制杂交组合。2015年8月25日将F1定植于上海市农业科学院庄行试验站,2016年4月11日,F1材料自花剥蕾授粉,2016年8月27日将亲本及F2群体材料定植于上海市农业科学院庄行试验站。
3.2试验方法
3.2.1表型性状调查
2016年10月8日,在结球期对试验材料进行表型性状调查。利用直尺对亲本及458份F2材料逐一进行叶柄长度和叶片长度的测量(选取第3片外叶),同时对全部材料进行取样提取基因组DNA。在对全部数据分析后,对用于构建混池的F2材料进行挂牌标记。
3.2.2建库及QTL-seq分析
对F2群体单株的叶柄长度与叶片长度的比值进行数据统计,从中选出23株比值最大的结球甘蓝单株和23株比值最小的结球甘蓝单株,将每组中的单株植物DNA等量混合,形成长柄池(L-pool)和短柄池(S-pool)。为保证分析质量将原始测序序列里面含有带接头的、低质量的Read进行过滤(过滤脚本为百迈客生物有限公司提供),得到Clean Reads,用于后续信息分析。将过滤后得到的数据定位到甘蓝参考基因组中(http://brassicadb.org/brad/downloadOverview.php),为了保证分析数据的准确性,使用Picard (http://broadinstitute. github.io/picard)、GATK (McKenna et al., 2010)进行数据预处理,再使用GATK进行SNP、INDEL多态性的检测,过滤,并得到最终的SNP、INDEL位点集。SNP-index和INDEL-index采用Abe的方法(Abe et al., 2012)进行拟合。ΔSNP-index (Takagi et al., 2013)和ΔINDEL-index (Takagi et al., 2013)被用作数据关联分析。
3.2.3表型数据分析
以叶柄长度与叶片长度的比值作为分析表型性状的参考数据。并利用SPSS19.0统计软件对数据进行正态分布检测。
作者贡献
邰翔、朱晓炜是本研究的实验设计和实验研究的执行人;邰翔完成数据分析,论文初稿的写作;陈锦秀、顾大国参与实验设计,试验结果分析;薄天岳是项目的构思者及负责人,指导实验设计,数据分析,论文写作与修改。全体作者都阅读并同意最终的文本。
致谢
本研究由‘十三五’国家科技重点研发计划项目(2016YFD0101702);上海市科技兴农攻关项目[沪农科攻字(2015)第6-1-7号];国家现代农业产业技术体系建设专项资金项目(CARS-25)共同资助。
Abe A., Kosugi S., Yoshida K., Natsume S., Takagi H., and Kanzaki H., 2012, Genome sequencing reveals agronomically important loci in rice using mutmap, Nature Biotechnol, (30): 174-179
Dai Z.L., Hou X.L., and Pan Y.P., 2007, The main qualitative characters of common head cabbage materials, Shanghai Nongyebao (Acta Agriculturae Shanghai), 23(01): 44-47 (戴忠良, 侯喜林, 潘跃平, 2007, 结球甘蓝种质资源主要品质性状的研究, 上海农业报, 23(01): 44-47)
Graaff.E.V.D., Dulkras.A D., Hooykaas P.J.J., and Keller.B., 2000, Activation tagging of the LEAFY PETIOLE gene affects leaf petiole development in Arabidopsis thaliana, Development, 127(22): 4971-4980
Fang Z.Y., 2008, Cultivation technologies of cabbage, Beijing, china, PP.1-7 (方智远, 主编, 2008, 甘蓝栽培技术, 金盾出版社,中国,北京,PP.1-7)
Fry and Stephen C., 1995, Polysaccharide-modifying enzymes in the plant cell wall, Annual Review of Plant Physiology and Plant Molecular Biology, 46(1): 497-520
Takagi H., Abe A., Yoshida K., Kosugi S., Natsume S., Mitsuoka C., Uemura A., Utsushi H., Tamiru M., Takuno S., Innan H., Cano L.M., Kamoun S., and Terauchil R., 2013, QTL-seq: rapid mapping of quantitative trait loci in rice by whole genome resequencing of DNA from two bulked populations, The Plant Journal, 74(1): 174-183
Hirokazu T., Toshiaki K., and Gyung T.K., 2002, Genetic control of petiole length in arabidopsis thaliana, Plant Cell Physiol, 43(10): 1221-1228
Lu H.F., Lin T., Klein J., Wang S.H., Qi J.J., Zhou Q., Sun J.J., Zhang H.H., Weng Y.Q., and Huang S.W., 2014, QTL seq identifies an early flowering QTL located near Flowering Locus T in cucumber, Theor Appl Genet, DOI 10.1007/s00122-014-2313-z
Sedbrook J.C., Carroll K.L., Hung K.F., Masson P.H., Somervillea C.R., 2002, The arabidopsis SKU5 gene encodes an extracellular glycosyl phosphatidylinositol-anchored glycoprotein involved in directional root growth, The Plant Cell, 14: 1635-1648
Li G.J., 2015, The roles of gibberellin in cell wall compositional changes and arabidopsis root elongation, Nanjing Agricultural University, Supervisor: Xia Kai, PP.6-7 (李桂俊, 2015, 赤霉素对细胞壁组分以及拟南芥主根伸长的影响, 南京农业大学, 导师: 夏凯, PP.6-7)
Matsui A., Yokoyama R., Seki M., Lto T., Shinozaki K., Takahashi T., Komeda Y., and Nishitani K., 2005, AtXTH27 plays an essential role in cell wall modification during the development of tracheary elements, Plant Journal, 42(4): 525-534
Mckenna A., Hanna M., Banks E., and Sivachenko A., 2010, The genome analysis toolkit: a map reduce framework for analyzing next generation DNA sequencing data, Renome research, 20(9): 1297-1303
Nakamura T., Yokoyama R., Tomita E., and Nishitani K., 2003, Two azuki bean XTH genes VaXTH1 and VaXTH2 with similar tissue-specific expression profiles are differently regulated by auxin, Plant Cell Physiol, 44(1): 16-24
Miao T.Y., 2007, Construction of molecular genetic map and mapping of QTL related to main agronomic traits in cabbage, Chinese Academy of Agricultural Sciences, Supervisor: Fang Z.Y., PP.1-1 (缪体云, 2007, 结球甘蓝遗传图谱的构建及主要农艺性状的QTL定位, 导师: 方智远, PP.1-1)
Pang W.X., Li X.N., Choi S.R., Nguyen V.D., Dhandapani V., Kim Y.Y., Ramchiary N., Kim J.G., Edwards D., Batley J., Na J.Y., Kim H.R., and Lim Y.P., 2015, Mapping QTLs of resistance to head splitting in cabbage (Brassica oleracea L.var. capitata L), Mol Breeding, 35(126): 1-12
Ren J., 2019, Molecular mechanism of the major ornamental trait variations in kale, shengyang agricultural university, Supervisor: Feng H., PP.89-109 (任杰, 2019, 羽衣甘蓝主要观赏性状变异的分子机制研究, 沈阳农业大学, 导师: 冯辉, PP.89-109)
Hisamatsu T., King R.W., Helliwell C.A., and Koshioka M., 2005, The involvement of gibberellin 20-oxidase genes in phytochrome-regulated petiole elongation of arabidopsis, Plant Physiology, 138(2): 1106-1116
Yang R.H., Liu J., Li J.N., Qian W., and Mei J.Q., 2019, QTL mapping and variation analysis of candidate gene for flower color in brassica oleraceal, Zhiwu Yichuan Ziyuan Xuebao (Journal of Plant Genetic Resources), 20(5): 1271-1277 (杨茹涵, 刘进, 李加纳, 钱伟, 梅家琴, 2019, 甘蓝花色性状QTL定位及候选基因变异分析, 植物遗传资源学报, 20(5): 1271-1277)
Wang S., 2016, Genome-wide association analysis for the traits related to feeding value of rapeseed (Brassica napus L.), Southwest University, Supervisor: Xu X.F., PP.36-42 (王书, 2016, 饲用油菜植株营养品质性状的关联分析, 西南大学, 导师: 徐新福,PP.36-42)
Zhang X.L., 2017, Mapping, cloning of clubroot resistance gene and the comparative transcriptome analysis between the re-sistant and susceptible accessions in brassica oleracea , Chinese Academy of Agricultural Sciences, Supervisor: Fang Z.Y., PP.36-47 (张小丽, 2017, 甘蓝类蔬菜抗根肿病基因定位、克隆及抗感材料比较转录组分析, 中国农业科学院, 导师: 方智远, PP.36-47)
Zhang Z.X., Chen Q.Z., and Cao J.S., 2011, Process of multicopper oxidase and its subfamily member sks in plant, Zhongguo Xibao Shengwuxue Xuebao (Chinese Journal of Cell Biology), 33(2): 167-172 (张志仙, 陈起振, 曹家树, 2011, 植物多铜氧化酶及其亚家族成员SKS蛋白, 中国细胞生物学学报, 33(2): 167-172)
Zhao T.J., Qiu J.X., and Gai J.Y., 1999, Studies on the inheritance of short petiole trait of soybeans from different sources and their agronomic performances, Zhongguo Youliao Zuowuxue Xuebao (Chinese journal of oil crop sciences), 21(3): 19-22 (赵团结, 邱家驯, 盖钧镒, 1999, 大豆不同来源短叶柄性状的遗传和有关农艺性状表现, 中国油料作物学报, 21(3): 19-22)